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Die VOLKSWAGEN Aktiengeselischaft in Wolfsburg/Deutschland hat eine 
Patentanmeldung unter der Bezeichnung 

"Verfahren und Vorrichtung zur automatischen Steuerung min- 
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Verfahren und Vorrichtung zur automatischen Steuerung mindestens eines 

Gerates per Sprachdialog 





Die Erfindung betrifft ein Verfahren und eine Vorrichtung zur automatischen Steuerung 
mindestens eines Gerates per Sprachdialog. 

Verfahren bzw. Vorrichtungen dieser Art werden allgemein in sogenannten Sprachdialog- 
bzw. Sprachbediensystemen z.B. fur Fahrzeuge, Computer, Roboter, Maschinen, Aniagen 
usw. eingesetzt. 

Ein Sprachdialogsystem (SDS) laRt sich i.a. im wesentlichen auf folgende Komponenten 
reduzieren: 

Spracherkennungssystem, welches ein eingesprochenes Kommando 
(„Sprachkommando") mit anderen erlaubten Sprachkommandos vergleicht und eine 
Entscheidung trifft, welches Kommando aller Wahrscheinlichkeit nach eingesprochen 
wurde, 

Sprachausgabe, welche die zur Benutzerfuhrung erforderlichen Sprachbefehle und 
Signalisierungstone ausgibt und ggf. das Erkennergebnis ruckmeldet, 
Dialog- und Ablaufsteuerung, urn dem Benutzter zu verdeutlichen, welche Art von 
Eingabe erwartet wird, bzw. urn zu priifen, ob die erfolgte Eingabe konsistent ist mit 
der Aufforderung und mit dem momentanen Status der Applikation, und urn die 
resultierende Aktion bei der Applikation (z.B. dem zu steuernden Gerat) anzustoflen, 
Kontrollinterface als Schnittstelle zur Applikation: Dahinter verbergen sich Hard- und 
Softwaremodule, urn verschiedene Aktuatoren bzw. Rechner anzusteuern, die die 
Applikation beinhalten, 

Applikation, die per Sprache angesteuert wird: Das kann z.B. ein Bestell- Oder 
Auskunftssystem, ein CAE-Arbeitsplatz oder ein behindertengerechter Rollstuhl sein. 

Ein solches Sprach-Dialog-System ist beispielsweise aus der DE 195 33 541 C1 bekannt. 
Zur Verbesserung der Akzeptanz eines solchen Mensch-Maschinen-Dialogs wird dort 
beispielsweise vorgeschlagen, fur die Kommandos synonyme Worte bzw. unterschiedliche 
Aussprachevarianten zu verwenden oder aber die Worter in den Kommandos umzustellen, 
beispielsweise „Gr6Berer Radius bei linkem Kreis" oder alternate hierzu „Bei linkem Kreis 



groBerer Radius". Des weiteren wird vorgeschlagen, durch einen erweiterten Speicher ein 
multilinguales sprecherunabhangiges Dialogsystem aufzubauen, wobei wahlweise zwischen 
den Dialogsystemen verschiedener Sprachen umgeschaltet werden kann. Weiter wird 
vorgeschlagen, sogenannte Ellipsen einzubinden, d.h. Verzicht auf Wiederholung ganzer 
Kommandosatze und start dessen Kommandos wie „hoher", „starker" Oder „weiter", wobei 
dann das Sprachdialog-System diese den vorangegangenen Kommandos zuordnet. Des 
weiteren kann das Sprach-Dialog-System bei unsicherem Erkennen Ruckfragen wie 
beispielsweise „Wie bitte?", M Bitte wiederholen" oder JJnd weiter?" stellen oder bestrmmte 
Anregungen wie „Bitte lauter" ausgeben. All diese MaBnahmen dienen dazu, eine monotone 
Kommunikation zu vermeiden und den Dialog starker einer Mensch-Mensch-Kommunikation 
anzunahern. Zur Verbesserung der Kommunikation wird das Sprachsystem mit einem 
optischen Anzeigemedium gekoppelt, auf dem erkannte Befehle zu Kontrollzwecken 
angegeben werden. Weiter ermoglicht das optische Anzeigemedium die Darstellung der vom 
Zielgerat als Reaktion auf das Sprachkommando eingestellten Funktionen und/oder 
verschiedener Funktionen/Alternativen, die per Sprachkommando anschlieBend eingestellt 
bzw. ausgewahlt werden konnen. Nachteilig an der bekannten Vorrichtung und des damit 
durchgefuhrten Verfahrens ist, da(3 trotz der dargestellten Verbesserungen die 
Sprachausgabe aufgrund ihrer Monotonie den Nutzer ermudet, so daB dessen Reaktionszeit 
bei handlungskritischen Aktionen zu groB ist. Ein weiteres Problem ist, daB bei 
Erkennungsschwierigkeiten die bekannten Sprach-Dialog-Systeme eine Endlosschleife 
durchlaufen und dem Nutzer immer wieder die gleiche Aufforderung ausgeben, so daB der 
work-flow unterbrochen ist. 

Der Erfindung liegt daher das technische Problem zugrunde, ein Verfahren und eine 
Vorrichtung zur automatischen Steuerung eines Gerates per Sprachdialog zu schaffen, bei 
denen bei handlungskritischen Anweisungen eine verbesserte Aufmerksamkeit des Nutzers 
erreicht wird sowie der work-flow sichergestellt ist. 

Die Losung des technischen Problems ergibt sich durch die Merkmale der Patentanspruche 
1, 2 und 8. Weitere vorteilhafte Ausgestaltungen der Erfindung ergeben sich aus den 
Unteranspruchen. 

Durch die Verwendung unterschiedlicher Intonationen, wobei bei handlungskritischen 
Anweisungen die Kommandos eine Befehlsintonation aufweisen, wird bereits unmittelbar bei 
der Sprachausgabe die Aufmerksamkeit des Nutzers geweckt, so daB die Reaktionszeit zur 
Durchfuhrung der geforderten Anweisung erheblich verkurzt wird. 



Zur weiteren Erhohung der Aufmerksamkeit und Unterscheidung von handlungskritischen 
Anweisungen kann die Lautstarke der Sprachausgabe bei handlungskritischen Anweisungen 
erhoht werden und/oder diese besonders hart bzw. abrupt eingeblendet werden. 

Weiter kann das Sprach-Dialog-System multilingual ausgebildet sein, so daB beispielsweise 
zwischen einer Manner- und einer Frauenstimme gewahlt werden kann, wobei dann bei 
handlungskritischen Anweisungen die eine und bei handlungsunkritischen Anweisungen die 
andere Stimme vom System ausgewahlt wird. 

Zur Sicherstellung des work-flows wird das Sprach-Dialog-System nur durch Betatigung 
eines „Push to talk" PTT-Schalters aktiviert, wobei bei Ausbleiben einer gultigen Interaktion 
die Dialog-Kommunikations-Ebene gewechselt wird. Zur Erhohung der Erkennungssicherheit 
bzw. zur Verbesserung der Nutzerfuhrung konnen einzelne Kommandos in verschiedenen 
alternativen Ausgabeformen abgespeichert sein, die dann bei einer ungultigen Interaktion 
sukzessive ausgegeben werden, wobei die Dialog-Kommunikations-Ebene erst gewechselt 
wird, wenn auf alle Kommandoformen keine gultige Interaktion erfolgt ist. Zur Vermeidung 
von Monotonie kann die Reihenfolge der Ausgabe durch einen Zufallsgenerator permutiert 
werden. 

Die Erfindung wird nachfolgend anhand eines bevorzugten Ausfiihrungsbeispiels naher 
erlautert. Die einzige Figur zeigt ein schematisches Flu3diagramm des Verfahrens zur 
automatischen Steuerung mindestens eines Gerates per Sprachdialog. 

Durch die Betatigung des PTT-Schalters wird das Sprach-Dialog-System aktiviert. Zum 
besseren Verstandnis wird die Sprachausgabe des Sprachdialog-Systems in Kommandos 
KOM und Aufforderungen Auff unterteilt, die in Realitat identisch sein konnen . Nachfolgend 
wird unter Kommandos KOM eine direkte Anweisung zum Handeln verstanden, wie 
beispielsweise „BREMSEN", „LICHTEINSCHALTEN M , wohingegen Aufforderungen eine 
Interaktion in Form einer Eingabe anfordern, wie beispielsweise „Bitte gewunschte 
Temperatur in Grad Celsius angeben". 

Erzeugt nun das Sprach-Dialog-System ein Kommando KOM, so wird dieses Kommando 
KOM danach unterteilt, ob es sich urn eine handlungskritische Anweisung oder eine 
handlungsunkritische Anweisung handelt. Vereinfacht sind handlungskritische Anweisungen, 
Kommandos KOM, die ein schnelles Durchfuhren der Handlung erfordern. Ein Beispiel 
hierfur ist das Kommando KOM „Bremsen", wenn ein ADR-System oder eine Prescrash- 
Sensorik ein Kollisionsobjekt erfaRt haben. Handlungsunkritische Anweisungen sind 



beispielsweise Kommandos KOM eines Navigationssystems. Dabei werden 
handlungskritische Anweisungen mit einer Befehlsintonations-Sprache S1, mit groBer 
Lautstarke L1 hart und abrupt in einer Zeit t1 eingeblendet, urn beim Nutzer einen hohen 
Aufmerksamkeitsgrad zu erzeugen. Handlungsunkritische Anweisungen werden hingegen 
weich bei geringerer Lautstarke 12 und normaler Intonation S2 eingeblendet. 

Aufforderungen Auff sind in der Regel zeitunkritisch, so daB hier ein gute Benutzerfuhrung im 
Vordergrund steht. Dazu kann eine Aufforderung Auff in n verschiedenen Alternativen im 
Sprachspeicher abgelegt sein. Die Alternativen konnen beispielsweise unterschiedliche 
Betonungen, Aussprachen, Wortumstellungen Oder synonyme Begriffe sein. Nach 
akustischer Ausgabe der ersten Alternative wartet das Sprach-Dialog-System eine 
vorgegebene Zeit auf eine Interaktion. Erfolgt innerhalb dieser Zeit keine Oder eine ungultige 
Interaktion, so wiederholt das Sprach-Dialog-System die Aufforderung mit der zweiten 
Alternative, gegebenenfalls bis zur n-ten Alternative. Erfolgt eine gtiltige Interaktion, so wird 
diese ausgefuhrt und gegebenenfalls eine neue Aufforderung Auff ausgegeben. Erfolgt 
hingegen auf die n-te Alternative der Aufforderung Auff keine gultige Interaktion, so wird auf 
eine andere Dialog-Kommunikations-Ebene DKE gewechselt, urn den work-flow 
sicherzustellen. Die neue Dialog-Kommunikatons-Ebene DKE ist dann beispielsweise eine 
Auswahlliste, die auf dem Bordmonitor dargestellt wird, woraus sich der Nutzer ein 
entsprechendes Menu auswahlen kann. 
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ZUSAMMENFASSUNG 



Verfahren und Vorrichtung zur automatischen Steuerung mindestens eines 

Gerates per Sprachdialog 



Die Erfindung betrifft ein Verfahren und eine Vorrichtung zur automatischen Steuerung 
mindestens eines Gerates per Sprachdialog, umfassend einen Sprachspeicher, in dem fur 
die Sprachausgabe benotigte Kommandos (KOM) in unterschiedlichen Intonationen abgelegt 
sind, wobei mindestens die Kommandos (KOM) fur handlungskritische Anweisungen eine 
Befehlsintonation aufweisen. 



(Fig. 1) 
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